Análisis de Extremos de Precipitación

✓ Esperando datos

Resumen Estadístico

Ver datos cargados

Serie Temporal

Diagrama de Caja

Detección de Posibles Outliers

Método del Water Resources Council basado en transformación logarítmica.

Los valores identificados deben ser verificados por el técnico responsable. Pueden ser errores de medición o eventos extremos válidos.

Identificación Visual de Outliers

Ajuste de Distribuciones

ℹ️ ⚠️ Los resultados de ajuste son orientativos. Datos con alta variabilidad, outliers extremos o series cortas pueden estar fuera del rango de aplicación de algunas distribuciones. Verifique siempre los resultados con criterio profesional.

Parámetros Ajustados

Test de Kolmogorov-Smirnov

Nivel de significación α:

Probabilidad empírica K-S:

Por defecto se aplica α = 0,20, equivalente a un nivel de confianza del 80 %. Para cada dato ordenado se compara la probabilidad teórica con la probabilidad empírica seleccionada: Weibull i/(n+1) o Gringorten (i - 0,44)/(n + 0,12).

ℹ️ Para n ≤ 35 se emplean los valores críticos tabulados del libro de Hidrología Estadística; cuando el tamaño no figura expresamente se interpola entre las dos filas tabuladas contiguas. Para n > 35 se utiliza Δcrítico = c(α)/√n.

Visualización de Ajustes

Significado de las Siglas

PDF (Probability Density Function): Función de Densidad de Probabilidad. Representa la probabilidad relativa de que la variable aleatoria tome un valor específico.

CDF (Cumulative Distribution Function): Función de Distribución Acumulada. Representa la probabilidad de que la variable aleatoria tome un valor menor o igual a un valor específico. Su valor siempre va de 0 a 1 (o de 0% a 100%).

Probabilidad empírica de Weibull: posición de no superación asignada a cada dato ordenado mediante P(xᵢ)=i/(n+1), sin asumir ningún modelo teórico.

Q-Q (Quantile-Quantile): Cuantil-Cuantil. Compara los cuantiles de dos distribuciones.

1. Weibull vs CDF Ajustadas

Compara la probabilidad acumulada de los datos reales frente a las curvas teóricas de los distintos modelos ensayados.

Puntos negros (Weibull): datos observados ordenados de menor a mayor. La posición vertical indica P(xᵢ)=i/(n+1).

Curvas de colores (CDF): modelos matemáticos ajustados.

Interpretación: cuanto menor sea la distancia vertical entre los puntos empíricos y una curva teórica, mejor es el ajuste global del modelo.

2. Histograma vs PDF

Evalúa cómo los modelos teóricos capturan la forma de la distribución de los datos observados.

Barras grises: frecuencia relativa o densidad de los datos agrupados en intervalos.

Curvas de colores: densidad de probabilidad teórica de cada modelo.

Interpretación: un buen ajuste envuelve el histograma de forma fidedigna, capturando el pico central y el decaimiento hacia las colas.

3. Gráfico Q-Q

Este gráfico suele aislar el modelo seleccionado como mejor ajuste para un análisis más detallado.

Eje X: cuantiles teóricos predichos por el modelo.

Eje Y: cuantiles observados reales para esas mismas probabilidades.

Línea roja discontinua: referencia 1:1, que representa el ajuste perfecto.

Interpretación: los puntos deben alinearse lo más estrechamente posible con la línea roja. Las desviaciones en la cola derecha indican si el modelo subestima o sobreestima los eventos extremos de mayor magnitud.

Probabilidad empírica de Weibull vs CDF ajustadas

Histograma y funciones de densidad

Distribución para Q-Q:

Gráfico Q-Q

Cálculos realizados

Función de distribución:

Cuantiles para Periodos de Retorno

Personalización del gráfico

Divergencia entre Distribuciones

Calculadora de Cuantiles

Periodo de retorno a calcular (años):

? Introduzca uno o varios periodos separados por comas (ej: 50, 100, 500)

Selección de Cuantiles

PRECIPITACIONES MAXIMAS EN 24 HORAS (mm)
RESUMEN DE LOS DISTINTOS AJUSTES

Valor seleccionado

Exportar

Informe técnico justificativo

Este informe se genera directamente a partir de la serie cargada y de los cálculos efectuados en la aplicación. Incluye, para cada ajuste, la función de distribución, el procedimiento de estimación de parámetros, el criterio de desviación típica, la intervención del número de registros, el contraste de Smirnov-Kolmogorov y los cuantiles obtenidos.

Extensión: Completo para proyecto Resumen ejecutivo

Asistente IA

Clave API de Groq o xAI

La clave se mantiene únicamente en memoria durante esta sesión.

Proveedor

Pregunta sobre tus datos Generar informe

Active el asistente e introduzca una pregunta sobre los datos y resultados calculados.

El informe se construye exclusivamente con los datos y resultados calculados en la aplicación.

Completo Resumen ejecutivo

Documentación Metodológica

Esta aplicación ajusta distribuciones de probabilidad a series de precipitación máxima anual mediante distintos métodos. A continuación se describen brevemente las distribuciones y métodos implementados.

Distribuciones de probabilidad

Normal — Método: MLE

\( f(x)=\frac{1}{\sigma\sqrt{2\pi}}\exp\left[-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2\right] \)

Dos parámetros: media \(\mu\) y escala \(\sigma\).

Gumbel (Valores Extremos Tipo I) — Métodos: MLE, MOM, PWM

\( F(x)=\exp\left[-\exp\left(-\frac{x-u}{\alpha}\right)\right] \)

Dos parámetros: localización \(u\) y escala \(\alpha>0\). Caso particular de la GEV con \(k=0\).

GEV (Generalizada de Valores Extremos) — Métodos: MLE, MOM, PWM

\( F(x)=\exp\left\{-\left[1-k\,\frac{x-u}{\alpha}\right]^{1/k}\right\} \)

Tres parámetros: localización \(u\), escala \(\alpha>0\) y forma \(k\).

\(k<0\) → Fréchet (cola pesada), caso habitual en precipitación extrema.
\(k>0\) → Weibull (cola acotada).
\(k\to0\) → se reduce a Gumbel.

Log-Normal — Método: MLE

\( F(x)=\Phi\left(\frac{\ln x-\mu_{\ln}}{\sigma_{\ln}}\right) \)

La variable \(\ln(x)\) sigue una distribución normal con media \(\mu_{\ln}\) y desviación típica \(\sigma_{\ln}\).

Log-Pearson III — Método: MOM

Se aplica la distribución Pearson III a \(Y=\log_{10}(x)\):

\( f(Y)=\frac{1}{\alpha^\tau\Gamma(\tau)}(Y-u)^{\tau-1}\exp\left(-\frac{Y-u}{\alpha}\right) \)

Tres parámetros en espacio logarítmico derivados del sesgo, media y desviación típica de \(Y\).

SQRT-ETmax (Etoh, 1987) — Métodos: máxima verosimilitud, L-momentos y Zorraquino

\( F(x)=\exp\left[-k\left(1+\sqrt{\alpha x}\right)\exp\left(-\sqrt{\alpha x}\right)\right] \)

Dos parámetros: forma \(k>0\) y escala \(\alpha>0\). La máxima verosimilitud resuelve las ecuaciones de verosimilitud; el ajuste por L-momentos iguala numéricamente los L-momentos muestrales y teóricos; Zorraquino obtiene \(k\) y \(\alpha\) mediante aproximaciones polinómicas en función del coeficiente de variación.

TCEV (Two Component Extreme Value) — Método: MLE

\( F(x)=\exp\left[-\lambda_1e^{-\theta_1x}-\lambda_2e^{-\theta_2x}\right] \)

Cuatro parámetros que representan dos poblaciones superpuestas: eventos ordinarios \((\lambda_1,\theta_1)\) y extraordinarios \((\lambda_2,\theta_2)\).

SQRT-ETmax: método de Zorraquino

El método de Zorraquino es un procedimiento aproximado para estimar los parámetros \(k\) y \(\alpha\) de la distribución SQRT-ETmax a partir de la media \(\bar{x}\), la desviación típica muestral \(S\) y el coeficiente de variación \(CV=S/\bar{x}\).

\[ \ln(k)=\sum_{i=0}^{6}a_i[\ln(CV)]^i,\qquad \ln(I_1)=\sum_{i=0}^{6}b_i[\ln(k)]^i \]

\[ \alpha=\frac{k}{1-\exp(-k)}\,\frac{I_1}{2\bar{x}} \]

Los coeficientes \(a_i\) y \(b_i\) cambian en los intervalos \(0{,}19\le CV<0{,}30\), \(0{,}30\le CV<0{,}70\) y \(0{,}70\le CV\le0{,}99\). Fuera de ese rango la aplicación no realiza el ajuste, porque la aproximación no es metodológicamente aplicable.

Coeficientes polinómicos empleados

Intervalo de CV	Coeficiente	0	1	2	3	4	5	6
0,19 ≤ CV < 0,30	aᵢ	-1765,86	-7240,6	-11785,6	-9538,0	-3834,3	-612,68	0
0,19 ≤ CV < 0,30	bᵢ	-0,931508	2,156709	-0,779770	0,112962	-0,009340	0,000412	-0,000008
0,30 ≤ CV < 0,70	aᵢ	1,801513	2,473761	23,556200	49,957274	59,775636	35,696876	8,505713
0,30 ≤ CV < 0,70	bᵢ	2,342697	-0,149784	-0,099312	0,003444	0,001014	-0,000141	0,000005
0,70 ≤ CV ≤ 0,99	aᵢ	1,318615	-3,16463	-1,59552	-6,26911	-11,3177	-22,6976	-22,0663
0,70 ≤ CV ≤ 0,99	bᵢ	2,307319	-0,136674	-0,075036	-0,013464	0,003228	0,000521	-0,000141

Trazabilidad: la aplicación muestra \(\bar{x}\), \(S\), \(CV\), el intervalo de coeficientes, \(I_1\), \(k\) y \(\alpha\). El método se mantiene separado de máxima verosimilitud y L-momentos.

Referencia metodológica: Carlos Zorraquino Junquera, “El modelo SQRT-ET MAX”, Revista de Obras Públicas, 151(3447), 2004, pp. 33-37. Los coeficientes prácticos empleados se corresponden con la ficha de aplicación difundida por la Universidad de Salamanca, que recoge cálculos posteriores del autor.

Métodos de ajuste

MLE (Maximum Likelihood Estimation) — Maximiza la verosimilitud de los datos observados para estimar los parámetros. Método más eficiente para muestras grandes.

MOM (Método de Momentos) — Iguala los momentos muestrales (media, varianza, asimetría) con los teóricos de la distribución.

PWM (L-Momentos) — Utiliza momentos ponderados por probabilidad (Hosking, 1985). Más robusto que MOM para distribuciones de cola pesada y muestras pequeñas.

Gumbel-MOM: cuatro variantes documentadas

La distribución de Gumbel se escribe en esta aplicación con dos parámetros: localización \(\mu\) y escala \(\alpha\):

\[ F(x)=\exp\{-\exp[-(x-\mu)/\alpha]\}, \qquad y=\frac{x-\mu}{\alpha} \]

Al ajustar por el método de los momentos se parte siempre de la media \(\bar{x}\), de una desviación típica \(S\) elegida por el usuario y de la variable reducida de Gumbel. La aplicación permite explícitamente las cuatro combinaciones necesarias:

Asintótica + \(S_{n-1}\): usa \(\mu_y=\gamma=0{,}5772157\), \(S_y=\pi/\sqrt{6}=1{,}28255\) y desviación típica muestral con divisor \(n-1\).
Asintótica + \(S_n\): usa las mismas constantes asintóticas, pero con desviación típica poblacional con divisor \(n\).
Tabulada + \(S_{n-1}\): usa \(Y_n\) y \(S_n^*\) tabulados/interpolados según el número de datos, con desviación típica muestral.
Tabulada + \(S_n\): usa \(Y_n\) y \(S_n^*\) tabulados/interpolados según el número de datos, con desviación típica poblacional.

En todos los casos se calcula \(\alpha=S/S_y\) y \(\mu=\bar{x}-\alpha Y_y\), donde \(Y_y,S_y\) son \(\gamma,\pi/\sqrt{6}\) en modo asintótico, o \(Y_n,S_n^*\) en modo tabulado.

\[ F=1-\frac1T,\qquad Y_T=-\ln[-\ln(F)],\qquad X_T=\mu+\alpha Y_T \]

En modo tabulado, la forma equivalente también queda disponible para comprobación:

\[ K_T=\frac{Y_T-Y_n}{S_n^*},\qquad X_T=\bar{x}+K_T S \]

Fuente de la tabla de \(Y_n\) y \(S_n^*\): Aparicio Mijares, Francisco J. Fundamentos de Hidrología de Superficie, página 264, tabla 9.6. Si \(n\) cae entre dos filas tabuladas se interpola linealmente; si queda fuera del rango de la tabla se informa y se emplean constantes asintóticas.

Apuntes visuales integrados: Gumbel por momentos

Estas fichas resumen la metodología que sigue la aplicación y quedan incorporadas como documentación interna de cálculo.

Gumbel por momentos: idea general y ajuste asintótico — Ficha 1. Idea general, desviaciones \(S_{n-1}\) y \(S_n\), ajuste asintótico y obtención del cuantil.

Gumbel por momentos: ajuste tabulado y variantes — Ficha 2. Ajuste tabulado con \(Y_n\) y \(S_n^*\), variantes y equivalencia de formulaciones.

Test de bondad de ajuste (Kolmogorov-Smirnov)

La aplicación utiliza el procedimiento de Smirnov-Kolmogorov empleado en hidrología estadística y en el proyecto de referencia. Se compara, para cada dato ordenado, la probabilidad teórica de la distribución ajustada con la probabilidad empírica calculada mediante la fórmula de Weibull.

Criterio aplicado por defecto

\( \alpha=0.20,\qquad 1-\alpha=0.80 \)

\( P(x_i)=\frac{i}{n+1},\qquad \Delta=\max_i\left|F(x_i)-P(x_i)\right| \)

El selector permite aplicar otros niveles de significación cuando el estudio lo requiera.

Apuntes visuales del método

Dos láminas para repasar las posiciones de trazado y la comparación con la distribución teórica.

Croquis conceptual y fórmulas de posiciones de trazado para el test de Kolmogorov-Smirnov — Lámina 1. Croquis conceptual, posiciones de trazado y significado de la máxima diferencia.

Ejemplo sencillo de aplicación de Weibull, Gringorten y Hazen antes de comparar con Gumbel — Lámina 2. Ejemplo ordenado paso a paso y recordatorio de fórmulas.

1 de 2

Para los datos válidos ordenados de menor a mayor:

\( x_1\leq x_2\leq\cdots\leq x_n,\qquad F(x_i)=P(X\leq x_i) \)

Se asigna a cada dato su número de orden \(i\) y su probabilidad experimental de Weibull:

\( P(x_i)=\frac{i}{n+1} \)

\( \Delta_i=\left|F(x_i)-P(x_i)\right|,\qquad \Delta=\max_i\Delta_i \)

\( z=\sqrt{n}\,\Delta,\qquad P(z)=1-K(z) \)

Para \(n\leq35\), el valor crítico \(\Delta_0\) se obtiene de la tabla del libro para el tamaño muestral y el nivel de significación seleccionados. Si el tamaño no aparece expresamente entre las filas publicadas, la aplicación interpola linealmente entre las dos filas contiguas. Para \(n>35\):

\( \Delta_0=\frac{c(\alpha)}{\sqrt{n}} \)

Si \(\Delta<\Delta_0\): no se rechaza \(H_0\); el ajuste se considera compatible con la muestra al nivel de significación seleccionado.

Si \(\Delta\geq\Delta_0\): se rechaza \(H_0\); debe probarse otra distribución o revisar el ajuste.

\(H_0\) es la hipótesis nula: la muestra puede considerarse compatible con la distribución teórica evaluada. No rechazarla no demuestra que la distribución sea verdadera; significa que el test no detecta diferencias suficientes para descartarla al nivel seleccionado.

¿Qué compara el test?

Compara \(P(x_i)=i/(n+1)\), probabilidad empírica de Weibull, con \(F(x_i)\), probabilidad acumulada de la distribución teórica ajustada. La mayor diferencia absoluta es el estadístico \(\Delta\).

¿Cómo se obtiene la probabilidad empírica?

Los datos se ordenan de menor a mayor. Al dato de orden \(i\) se le asigna \(P(x_i)=i/(n+1)\). Esta posición de Weibull evita asignar probabilidad cero al mínimo o uno al máximo y es la convención adoptada por la metodología hidrológica de referencia.

Ejemplo sencillo

Para \(n=5\) e \(i=3\), \(P(x_i)=3/6=0.50\). Si la distribución ajustada proporciona \(F(x_i)=0.55\), entonces \(\Delta_i=|0.55-0.50|=0.05\). El cálculo se repite para todos los registros y se selecciona la mayor diferencia.

Nivel de significación α y nivel de confianza

Por defecto se utiliza \(\alpha=0.20\), reproduciendo el criterio del proyecto de referencia. El nivel de confianza asociado es \(1-\alpha=0.80\), es decir, un 80 %.

Este criterio es más restrictivo que \(\alpha=0.05\), porque establece un valor crítico menor y exige una diferencia máxima más reducida.

\( n=28,\ \alpha=0.20:\quad \Delta_0\approx0.198 \)

El valor anterior se obtiene por interpolación entre las filas \(n=25\), \(\Delta_0=0.210\), y \(n=30\), \(\Delta_0=0.190\), de la tabla reproducida en el libro.

Valor crítico y constantes disponibles

Para \(n\leq35\) se utilizan los valores críticos tabulados. Para \(n>35\), \(n\) es el número de datos válidos, \(\alpha\) el nivel de significación y \(c(\alpha)\) la constante:

\(\alpha=0.20\) → \(c(\alpha)=1.07\)
\(\alpha=0.15\) → \(c(\alpha)=1.14\)
\(\alpha=0.10\) → \(c(\alpha)=1.22\)
\(\alpha=0.05\) → \(c(\alpha)=1.36\)
\(\alpha=0.01\) → \(c(\alpha)=1.63\)

Interpretación del resultado

Si \(\Delta<\Delta_0\), el test no detecta diferencias suficientes y se muestra «No se rechaza \(H_0\)». Si \(\Delta\geq\Delta_0\), la diferencia alcanza o supera el límite y se muestra «Se rechaza \(H_0\)».

La expresión correcta es «no se rechaza \(H_0\)», no «se acepta definitivamente la distribución».

Diferencia con Gringorten

El contraste utiliza Weibull:

\( P_{\mathrm{Weibull}}(x_i)=\frac{i}{n+1} \)

Gringorten, \(P(x_i)=(i-0.44)/(n+0.12)\), no interviene en el cálculo de \(\Delta\). Para mantener un criterio único, la aplicación actual también utiliza Weibull en las representaciones empíricas y en el gráfico Q-Q.

Elección del mejor ajuste

Cuando varias distribuciones no son rechazadas, la aplicación las ordena por menor \(\Delta\). El modelo con menor \(\Delta\) presenta la menor diferencia máxima entre la probabilidad teórica y la posición empírica de Weibull.

El K-S no debe ser el único criterio de selección: es poco sensible a las colas, precisamente relevantes en máximos anuales. También deben revisarse los cuantiles para periodos altos, los gráficos, la coherencia hidrológica y el criterio técnico.

Resumen operativo del cálculo

Elimina valores nulos, vacíos, no numéricos o inválidos.
Ordena los datos válidos de menor a mayor.
Calcula \(P(x_i)=i/(n+1)\) y la probabilidad teórica \(F(x_i)\).
Calcula \(\Delta_i=|F(x_i)-P(x_i)|\) y selecciona \(\Delta=\max\Delta_i\).
Calcula \(z=\sqrt n\,\Delta\), \(P(z)=1-K(z)\) y el valor crítico tabulado o asintótico.
Compara ambos valores y muestra si se rechaza o no se rechaza \(H_0\).

Detección de outliers (Water Resources Council)

Basado en el Bulletin 17B/C. Se trabaja en escala logarítmica:

\( Y_i=\log_{10}(x_i) \)

Los umbrales superior e inferior se calculan mediante:

\( Y_{\mathrm{sup}}=\overline{Y}+K_nS_Y,\qquad Y_{\mathrm{inf}}=\overline{Y}-K_nS_Y \)

donde \(K_n\) es un coeficiente tabulado que depende del tamaño muestral \(n\). Los valores fuera del rango \(\left[10^{Y_{\mathrm{inf}}},10^{Y_{\mathrm{sup}}}\right]\) se marcan como posibles outliers.

Cuantiles y periodo de retorno

El cuantil \(x_T\) asociado a un periodo de retorno \(T\) se obtiene como:

\( x_T=F^{-1}\left(1-\frac{1}{T}\right) \)

donde \(F^{-1}\) es la función cuantil (inversa de la CDF) de la distribución ajustada.

Interpretación: \(x_T\) es la precipitación que, en promedio, se iguala o supera una vez cada \(T\) años. No implica periodicidad; es una medida probabilística.